Raspagem de dados com R

Curso
Autor

Beatriz Milz

Data de Publicação

21 de outubro de 2024

Evento: cebrap.lab online
Link: https://cebrap.org.br/cebrap-lab/
Lugar: Online

Materiais





Descrição

O curso “Raspagem de dados com R” abordará uma introdução ao uso da linguagem de programação R para obter dados da internet através de uma técnica chamada raspagem de dados (web scraping).

O curso abordará conceitos como:

  • o que é raspagem de dados?;

  • política de uso;

  • tipos de problemas de raspagem (APIs (disponíveis e “escondidas”);

  • raspagem de HTML (estático e dinâmico), etc);

  • entre outros.

O curso apresentará exemplos de raspagem de dados em todas as aulas, raspando sites que são interessantes no contexto brasileiro!

Todas as ferramentas utilizadas são gratuitas: utilizaremos a linguagem de programação R, o RStudio, e os pacotes tidyverse, httr, rvest, xml2, purrr, entre outros.

O curso tem como público alvo pessoasque tenham interesse em obter dados através da técnica de raspagem de dados na internet utilizando R, e que tenham familiaridade fazendo as seguintes tarefas em R: importar bases de dados, filtrar linhas, selecionar colunas, agrupar a base, criar sumarizações, criar novas colunas (pacotes readr e dplyr do tidyverse).